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fi 要 : 智能 车 联网 通过 大 量 的 地 面 传 感 器 收集 的 数据 来 获得 有 关 交 通 状 况 的 信息 ， 所 收集 的 数据 通常 具有 不 规则 的 
空间 和 时 间 分 辨 率 ， 数 据 丢 失 是 面 对 智 能 车 联网 中 的 一 个 常见 问题 。 鉴 于 此 ， 考 虑 了 大 型 和 多 样 化 车 联网 中 的 缺失 数 
据 问 题 。 通 过 在 智能 车 联网 中 提取 公共 交通 模式 ， 比 较 了 函数 估计 和 张 量 分 解 等 方法 来 估计 这 些 缺 失 值 的 优 为 后 ， 提 
出 了 张 量 低 秩 近似 估计 新 方法 ， 该 方法 在 缺失 数据 的 情况 下 获得 流量 模式 ， 得 到 大 规模 车 联 路 网 的 低 秩 表示 。 通 过 不 
同 的 道路 车 联网 实验 测试 ， 表 明 新 方法 的 估计 精度 、 数 据 集 的 偏差 达到 了 较 好 的 效果 。 
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Abstract: Intelligent Internet of Vehicle (IOV) gathers relative traffic information by all kinds of on-ground sensors. The 
gathered data often include irregular spatial and temporal resolution, so losing data is a common problem of IOV. In order to 
solve this problem, this paper proposed a kind of new approach of losing data evaluation for TOV which was named tensor 
low-rank approximation(VBPCA) based on the extracting the common traffic pattern and comparing the function estimation & 


tensor decomposition. The approach can get the traffic patterns under the cases of losing data and the expression of low-rank. 


In the experiments to test the approach, it select about 1000 road segments to do the analysis. The results show that this 


— approach has good performance on evaluation accuracy, the bias of the data set, so it is very useful for the application of 


intelligent internet of vehicle. 
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丢失 的 数据 百分比 可 高 达 90% 031。 对 于 交通 管理 系统 , 这 是 一 

个 关键 问题 419。 

随 着 传感器 技术 的 进步 ， 智 能 车 联网 现在 可 以 从 范围 广泛 解决 数据 缺失 问题 的 方法 大 致 可 分 为 两 类 : 函数 估计 和 甜 

的 固定 和 移动 传感器 ("3 收集 交通 数据 ,固定 传感器 如 线圈 检测 。” 阵 / 张 量 完备 化 。 在 第 一 种 情况 下 ,通常 假定 缺失 数据 的 问题 局 
器 和 路 边 的 相机 的 空间 范围 往往 有 限 ， 而 移动 传感器 ， 如 GPS ” 限于 某 些 已 知 链接 和 时 间 间 隔 。 这 样 ， 历 史 数 据 就 可 以 用 来 获 
探头 收集 的 数据 具有 高 度 不 稳定 的 空间 和 时 间 分 辨 率 。 这 些 问 ” 取 目 标 道路 与 其 邻近 或 过 去 道路 之 间 的 关系 函数 。 例 如 ， 文 献 
题 造成 了 流量 数据 集中 不 可 避免 的 数据 丢失 问题 。 此 外 ， 诸 如 [17,18] 利 用 历史 数据 建立 相 邻 环 路 检测 器 之 间 的 关系 模型 。 这 
检测 器 故障 和 有 损 通信 系统 等 故障 也 可 能 导致 交通 信息 不 完整 ”种 关系 函数 是 用 来 归结 故障 探测 器 缺失 值 , 文献 [19,20]] 训 练 神 
481。 这 可 能 会 导致 出 现 高 比例 的 数据 丢失 。 因此， 丢失 的 数据 ”经 网 络 并 利用 时 间 特 征 估 计 缺 失 值 。 文 献 [21~23] 还 使 用 了 类 似 
是 交通 数据 集中 常见 的 问题 信 久 ,在 这 方面 的 不 同 研究 报告 说 ， ”的 方法 和 应 用 最 小 二 乘 支持 向 量 机 估计 缺失 值 。 函 数 估计 技术 
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需要 完整 的 历史 数据 来 得 到 关系 模型 。 因 此 ， 如 果 历 史 数 据 有 


缺少 值 ， 


这 些 方法 将 无 法 使 用 。 在 实际 场景 中 ， 


数据 可 


的 收益 。 
相 


能 不 可 用 。 
数据 来 执行 插 补 。 因 此 ，i 


邻 道路 的 


未 损坏 的 历史 


看 ， 和 矩阵 和 张 量 补 全 方法 不 需要 训练 
这 些 方法 在 交通 研究 领域 获得 了 很 大 


R=) 


OERD É H FRA RPE, RE RERE 


TELS PM 2 
些 模式 来 估计 缺失 值 ， 
ERF 
大 多 集中 在 从 几 
[24~26 ]} 
他 们 分 析 了 一 个 


各 可 以 用 1 


这 


人 E 模 型 来 表示 。 和 矩阵 和 张 量 完成 方法 利 ) 

通过 获得 不 完全 张 量 /矩阵 的 合适 的 低 秩 
通 数 据 集 的 矩阵 / 张 量 补 全 方法 的 研究 
条 道路 或 交叉 口 获得 的 数据 上 。 例 如 ， 文 献 


J Lu 


f 主 成 分 分 析 (BPCA ) 对 交通 流 数 据 进行 插 补 。 


由 100 条 道路 组 成 的 小 网 络 。 文 献 [8~13]) 


J3% 


城 
模式 。 


失 数 据 的 问题 
、 道 路 ) 和 一 
也 们 没有 分 析 估 算 插 让 
占 计 方法 的 应 用 受 限 于 依赖 未 损坏 的 历史 数据 的 大 型 


| 


量 分 解 方法 进行 他 


和 其 代表 的 数 扩 


插 补 函数 
网 络 。 以 
几 个 交叉 点 的 数据 。 
周 内 不 同日 子 


市 规模 网 


时 从 每 个 道路 得 到 


通过 分 析 ， 他 们 认为 四 个 路 段 
3 张 量 。 
络 中 的 交通 状况 也 往往 具有 


失 数据 插 补 。 


某 些 共同 的 全 球 


ie 


鉴 


大 型 公路 网 扩展 到 高 


维 模型 的 等 级 对 插 补 性 
于 此 ， et 


Bu DM. FA 


尽管 方法 有 限 ， 一 些 研 究 2529 已 经 考虑 了 大 型 网 络 中 缺 
。 这 些 研究 没有 分 析 不 


司 道路 类 型 (高 速 公路 、 
内 不 同日 子 的 插 补 算法 的 性 能 。 
交通 数据 的 偏差 和 方差 。 总 之 ， 


周 或 半 个 月 


法 的 研究 大 多 只 考虑 一 个 或 
这 些 研究 通常 不 分 析 不 同 插 补 道路 类 型 和 
需要 考虑 方差 、 偏 差 以 及 低 


4 性 


影响。 


将 执行 缺失 的 数据 插 补 的 
速 公 路 、 干 线 公 路 、 次 干线 道路 和 支 路 等 


情形 。 提 出 张 量 低 秩 近 似 估计 新 方法 CVBPCA) ， 可 以 从 不 完 


全 数据 中 提取 全 局 流量 模式 。 将 上 述 方法 与 加 权 最 小 二 
和 近似 奇异 值 分 解 (FPCA) 等 
方法 针对 不 同道 
算 速 度数 和 


本 


数据 的 | 
函数 估计 和 张 量 分 解 等 方法 来 估计 这 些 缺 失 值 的 优 劣 后 ， 提 出 
了 张 量 低 秩 近似 估计 新 方法 (VBPCA) ， 该 方法 在 缺失 数据 的 
量 模式 ,得 到 大 规模 路 网 的 低 秩 表示 。 结 果 表明 ， 
能 对 交通 数据 的 日 变化 不 敏感 。 此 夕 


情况 下 获得 流 司 
该 算法 的 性 
加 权 相 对 误差 (WE) 、 


MAE Bar 
可 题 


出 


路 类 别 和 每 周 天 数 的 性 能 、 
居中 的 方差 和 偏差 。 


乘法 LS 
方法 的 性 能 进行 比较 。 分 析 这 些 
以 及 这 些 方法 在 估 


C 


贡献 如 下 : 针对 大 规模 智能 车 联网 系统 中 缺失 
过 在 智能 车 联网 中 提取 公共 交通 模式 ， 比 较 了 


， 该 方法 还 在 
方差 V) 和 偏 


均 方 根 误差 (MSE) ~ 


Z B) 等 方面 具有 更 好 的 性 能 。 


1 ”车 联网 数据 集 与 性 能 度量 


针对 车 辆 网 数据 集 ， 
来 表示 大 小 为 p 的 测试 道路 网 ， 例 
考虑 平均 速度 数据 。 


JER. 采样 间隔 At 是 3 min, 每 个 链 路 s,， 创 建 了 一 个 


Zs, +t 


速度 剖面 


aR”, 


本 文 用 


组 道路 线段 s 的 固定 的 E 值 
如 E={s;》>,。 在 这 项 研究 中 ， 
在 区 间 链 路 $ 上 的 平均 速度 {t -At t) 


Zs; stn} i 


例如 ai 一 [Z(s;-t1)- -9 


甘 

张 德 干 ， 等 : 一 种 面向 智 ChinaX ive (ERAT 

速度 配置 文件 包含 每 个 链接 的 一 天 速度 数据 。 根据 这 些 速 

度 曲线 来 获得 网 络 配置 矩阵 4s Re ， 比 如 4= 上 四 …aj|。 令 

De Re" 是 相应 的 不 完全 观测 数据 矩阵 。 集 Q 收录 词 条 的 位 置 

在 刀 的 速度 数据 是 可 用 的 ， 集 @= O° 表示 在 D 丢失 速度 值 的 
位 置 。 

对 张 量 的 完成 方法 ， 创 建 的 网 络 配置 张 量 4s RP, dct 


闭 放 在 一 起 的 网 络 配置 矩阵 A; As… A,} 从 不 同 的 日 子 形成 3 


张 量 。 为 此 ， 使 用 g=7 ~14 天 的 数据 。 在 这 种 情况 下 ， 不 完 
全 张 量 由 De R 表示 。 

为 了 分 析 ， 考虑 多 个 测试 网 络 。 每 个 网 络 中 的 道路 属于 天 
津 的 城市 道路 网 ， 有 足够 的 数据 可 供 使 用 。 每 个 测试 网 络 的 速 
度数 据 由 天 津 的 陆路 交通 管理 局 提供 。 

针对 性 能 度量 ， 下 面 描述 不 同 的 性 能 评估 方法 。 

对 于 矩阵， 定义 加 权 相 对 误差 CWE) 实际 4 和 估计 4 之 
间 的 网 络 分 布 : 

we). an 
[Wel]. 
其 中 : 符号 @ (MEME ZA TCR AAR. EEWw e R” 值 
的 权重 矩阵 ; 
_f0 Cjso 
Wi 11 (i ) © (2) 
FERE A e R”” 的 Fresenius 范 数 |4| 定义 为 
IA (3) 
同样 ， 定 义 为 WE 张 量 为 
|we(a-4) 
WE = £ (4) 
[Wea], 
其 中 : 符号 @ 代表 两 张 量 之 间 的 元 素 相 乘 。 张 量 e RO 为 带 
权 值 的 张 量 : 
_[0 (ike 
Wa | (i, j,k)eO (5) 

KE Ae R” 

Pye an (6) 


i=l j=l k=1 


JASE RT IR ZEEE 8 FS AE VE Ah BE A Be SE IE AY PE 
能 。 计 算 均 方 根 误差 (MSE) 的 估计 算法 如 下 : 


MSE (7) 
MSE an= (8) 
其 中 ，|@| 代 表 集 @ 的 大 小 。 计 算 估算 速度 数据 中 的 偏差 ， 如 
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下 所 示 : 
1 
B nar BOr 7 (a -6,) (9) 
i,j)e 
1 
Been “Foleo — iy) (10) 
i,j.k)e 
此 外 ， 计 算 了 估计 值 的 方差 如 下 : 
1 _ \2 
Vin “ij (a7) (11) 
1 _ \2 
Vea EOT > (a -ão ) (12) 


其 中 ; Ty PARER ADM A2 h Âs h po W Âi Jg jao 


的 平均 值 。 
2 ”缺失 数据 估计 新 方法 


本 章 在 讨论 最 小 二 乘法 (LS) 和 固定 点 连续 近似 奇异 值 分 
fE FPCA) 恢复 不 完整 矩阵 的 丢失 速度 信息 的 补 全 算法 的 基础 
上 ， 设 计 缺 失 数据 估计 的 新 方法 (VBPCA) 。 

2.1 最 小 二 乘法 (LS) 

在 一 个 相互 连接 的 网 络 中 ， 速 度 等 交通 参数 趋向 相似 ,， 利 
用 这 些 洪 在 的 模式 来 恢复 不 完整 矩阵 D 中 的 丢失 的 速度 信息 。 
为 此 ， 首 先 考虑 完成 网 络 配置 的 矩阵 A， 运 用 主 成 分 分 析 

(PCA) ， 可 以 从 网 络 配置 息 阵 A 中 得 到 一 个 低 秩 近似 《〈 秩 为 


r) A=WX +M， 其 中 We R” 和 多 e R”? EDI MRE, 


KF, 


min rank (â) st. â; 


上 述 提 到 的 优化 问题 


的 于 失速 度数 ] 


Gl hinaXiy 合作 期 刊 


等 : 一 种 面向 智 联网 的 缺 dae bit an 


fa, hei ° 然而 


易于 处 理 的 ， 可 以 通过 其 


为 


Sih. A r KERE A 的 核 范 数 定义 为 | 让 Ena ，cr 是 第 


个 奇异 值 矩 阵 。 


JJ， 这 是 


页 试图 恢复 带 有 最 小 数目 的 潜在 成 分 
时 同时 保持 所 观察 到 的 数据 提供 的 速度 信息 


此 


-djl<sv(ij)ed as) 


个 非 凸 和 NP 困难 问题 。 为 了 使 问题 


包 络 蔡 换 rank(A), ， 这 原来 是 估计 


矩阵 外 的 一 个 核 范 数 | 人 | 。 这 样 ， 式 aD 中 的 问题 可 以 改写 


min|4| st. a, —d, j| <6 ¥( i,j)€Q (16) 


考虑 


nis 


固定 点 连续 近似 奇异 值 分 解 FPCA) 解 


决 式 (16) 中 定义 的 优化 问题 。 
2.3 缺失 数据 估计 的 新 方法 


法 (VBPCA) 。 


在 上 文 讨 论 最 小 二 
解 FPCA) 恢复 不 完整 矩阵 
上 ， 本 节 设 计 缺 失 数据 估计 
上 文 已 经 


乘法 (CLS) 和 固定 点 连续 近似 奇异 值 分 


的 丢失 速度 信息 的 补 全 算法 的 基础 


的 新 方法 ， 即 张 量 低 秩 近似 估计 方 
十 论 了 不 同 的 矩阵 补 全 方法 来 提取 道 


路 网 络 中 的 底层 交通 模式 ， 然 而 ， 这 些 方法 不 能 有 效 地 利用 交 


通 数据 集中 的 多 路 径 


路 交通 的 行为 。 


当然 ， 


M e Re 是 A 的 行 的 平均 值 , 这 个 分 解 可 通过 求解 下 面 的 最 小 
二 乘 优 化 问题 得 到 : 


min DY, ay , â =W" X,+my (13) 


在 约束 条 件 下 ， 向 量 贡 六 保持 正 交 。 就 不 完整 矩阵 D 来 


说 ,可 以 将 问题 用 只 观测 速度 数据 4y), )s 的 重建 误差 最 小 化 


的 形式 来 再 次 表示 ， 其 中 必 代表 在 路 段 9 时 间 卢 处 速度 值 。 因 
此 ， 优 化 问题 将 成 为 


min Pa, -6), a4,=W,X,+m, (14) 


在 本 文中 ， 用 常用 的 梯度 下 降 算法 解决 (14) 中 的 最 优化 


2.2 固定 点 连续 近似 奇异 值 分 解 

本 节 中 讨论 了 另 一 种 可 选择 的 方法 来 估计 丢失 的 交通 信 
息 。 本 文 的 目标 是 利用 不 同道 路 {8,)*, 上 的 共同 交通 行为, 在 不 
完全 数据 矩阵 D 中 恢复 这 些 缺 失 的 速度 值 。 为 此 ， 需 要 得 到 一 
个 合适 的 从 不 完整 速度 数据 逼近 的 低 秩 矩阵 4 。 此 外 ， 估 计 网 
络 配置 人 也 应 该 保护 速度 信息 在 具有 一 定 的 耐 受 极限 E 的 不 
完全 数据 矩阵 D PHA, W fa -d|<eh pae 因此， 可 以 设置 如 
下 的 优化 问题 ， 


常 模式 。 可 以 通 
提取 这 些 时 间 关 系 ， 为 此 ， 
量 分 布 是 由 


度数 据 。 这 个 


获得 张 量 的 低 秩 近 似 。 对 
方式 对 观测 速度 数据 进行 


秩 近 似 A: 


. 1 
mins 


依赖 关系 。 例 如 ， 考 虑 一 周 中 不 同时 间 道 
交通 参数 ， 如 速度 ， 往 往 遵循 类 似 的 日 
过 创建 交通 数据 的 多 路 结构 这 种 更 有 效 的 方式 
用 3 KE A e R?” 的 形式 代表 速 


堆 共 在 一 起 的 从 不 同时 间 中 获得 的 


网 络 分 布 矩 阵 YA, Ay A,} 得 到 的 。 典范 (CP) 分 解 通常 用 于 
1 于 不 完整 张 量 配置 D， 可 以 通过 
E 建 误差 最 小 化 ， 得 到 一 个 合 ; 


Jop: DU") 是 现代 因子 矩阵 


符号 表示 矢量 外 积 ， 


因子 矩阵 BO 


iR A=D eb? eB a7) 


i=l 


BM") 的 第 i 列 向 量 。 ER (17) 中 ， 


而 符号 @ 代表 两 个 张 量 之 间 元 素 相 乘 。 
和 好 6) 包 含 张 量 的 不 同 模式 下 的 公共 通信 模 


式 。 ena 司 天 和 不 同道 路 之 间 的 公共 交通 行为 。 


应 用 CP 力 


中 获得 合适 的 估计 A。 


补 性 能 多 方 表征 


另 一 个 网 络 概要 矩阵 UV RO 


[0 权 优 化 (CP-OPT) 从 不 完整 的 网 络 配 置 张 量 DD 


E 展 开张 量 方面 利用 CP-OPT 来 研究 插 


的 影响 。 为 此 ， 通 过 组 合 多 天 的 速度 数据 创建 


=[4,,...4,]. 这 种 网 络 配置 


EEU 本 质 上 是 
相应 的 不 完全 数据 矩阵 


网 络 配 


IKE A 的 展开 表示 ， 在 这 种 情况 下 ， 


ED, 


表示 。 通 过 对 观测 速度 数据 的 重建 


误差 最 小 化 ， 得 到 了 不 完全 速度 数据 D, 的 矩阵 U AR 
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min5 swale. -0 ， Û = Da ov! 


由 此 ， 运 用 CP-OPT 来 得 到 估计 网 络 分 布 矩 阵 
法 称 为 张 量 低 秩 近似 估计 方法 (VBPCA) 。 


(18) 


U, 这 一 方 


基于 上 文 的 分 析 , 缺失 数据 估计 的 新 方法 (VBPCA) 的 步骤 


可 Hi 述 如 下 : 
引 设 置 初始 参数 值 。 用 一 组 道路 线段 s 的 固定 的 E 值 来 表 
示 大 小 为 p 的 测试 道路 网 E= 发 只 o EEE s, 上 的 平均 


速度 (ty- Ab tb 
链 路 $ ， 创 建 了 一 个 速度 剖面 as R”, 

b) 计 算 如 下 相关 向 量 a =[Z(s;-t1)--» Z(si 
文件 包含 每 个 链接 的 一 天 速度 数据 。 
c) 通 过 车 联网 传感器 网 络 采 集 不 同日 
HAR ETE, WER, KTE) P 
速度 、 时 间 、 道 路 、 车 辆 数 等 ) 得 到 数据 集 。 
出 网 络 配置 矩阵 4s R”, Aaral 
应 的 不 完全 观测 数据 矩阵 。 


度 配 


期 不 同道 路 类 型 (高 
的 相关 参数 数据 如 
从 数据 集中 抽 
令 数 据 矩 阵 Des 尺 "是 相 


Zs ,ti 表示。 设置 采样 间隔 At 是 5 min。 每 个 


,ta)] 。 速 


取 


d) 利 用 上 文 定 义 的 式 (D)~(6) 来 处 理 


张 量 和 范 数 ， 同 时 利用 


上 文 定义 的 式 (7)~(8) 来 计算 均 方 根 误差 ， 并 且 利 用 


上 文 定义 的 


式 (9)~(12) 来 计算 估计 值 的 方差 。 


6) 基于 上 文 的 式 (17) 对 观测 速度 数据 进行 重建 误差 处 理 , 得 


到 一 个 合适 的 低 秩 近 似 4， 应 用 CP 加 权 优 化 (CP- 
完整 的 网 络 配置 张 量 忆 中 获得 合适 的 估计 4 。 


利用 上 文 的 式 (18) 得 到 了 不 完全 速度 数据 D, 


的 低 秩 逼 近 廊 ， 从 而 得 到 估计 网 络 分 布 矩 阵 U。 
四 基于 测试 数据 集 ， 评 估 考 虑 不 同 数 量 的 潜在 


OPT) 从 不 


的 矩阵 U 


因素 《〈 秩 ) 


的 缺失 数据 加 权 相 对 误差 和 不 同道 路 网 在 一 段 时 间 


容忍 范围 内 ， 则 结束 估计 过 程 ， 否则 ， 重 返 
的 估计 ， 直 到 符合 要 求 时 为 止 。 
上 述 算法 的 步骤 可 用 伪 代 码 将 要 描述 如 下 : 
1) set E= {si}, At = 


ai =[Z(si>ti)--» Asirtn)I > a € R” 
2) extract A=|a.a,], Ae R, DeR™ 


3) calculate WE, ||All, MSE, B, V by equations (1)~(12) 


4) get A = yo” ob” Ob by equation (17) 


i=l 


5) get U => ph 〇 DO) by equation (18) 


i=l 


6) if error E < threshold then exit or quit else go to 2). 
测试 与 讨论 
本 章 讨论 


秩 (潜在 Ep 


内 不 同 


日 子 


的 算法 加 权 相 对 误差 。 如 果 缺 失 数据 估计 精度 的 误差 在 预定 的 
步骤 b) 进 行 下 一 轮 


300s 


因素 的 数量 ) 的 选择 对 算法 


能 的 影 响 。 


,aCe 


图 1 显示 了 从 京 济 


提 


选 


同 算法 的 重建 性 能 的 变化 。 
的 速度 数据 的 这 些 变 化 。 
法 的 性 能 ， 试 图 通 
是 取 数 据 中 的 公共 模式 。 
对 于 大 量 的 缺失 数据 ， 这 些 算法 的 重建 误差 可 以 根 
择 而 显著 变化 。 此 外 ， 


过 对 观测 到 


公路 获得 的 速度 数据 选择 等 级 


车 联网 aX ive. 


2 AN SCE ERE Pi 


2 


的 速度 信 


与 高 速 公路 相 


的 


颜色 和 数值 代表 的 意义 是 加 权 相 对 误差 (含义 与 图 3 4 
的 含义 相同 )。 图 1 和 2 中 图 谱 颜 
能 波动 越 显 著 ， 相 对 误差 越 大 。 另 一 方面 
VBPCA 重 构 误 差 在 不 同 的 秩 值 处 变化 不 显著 。 


明 性 


波动 性 能 更 为 显著 《参见 


Z] 


从 图 中 可 以 看 出 ， 


色 变化 


设计 的 YBPCA 方法 可 


数量 的 基 


RADA 


Ce) 和 图 2 (c) 为 VBPCA 的 秩 值 
络 分 布 矩 阵 的 因素 的 最 大 数量 的 极限 ， 同 时 ， 设 定 VBPCA 对 


潜在 因素 最 大 限于 


如 果 等 级 合适 的 | 
MR. 


潜在 因素 K) 


a 


潜在 因素 (K) 


WEAK GK) 
a w = 


<i 


1 和 2) 。 


越 频繁 或 颜 


ee 


合作 期 刊 


据 估 计 新 方法 


引起 的 不 


首 获得 
讨论 LS、FPGA 和 VBPCA 这 三 种 算 


F 道 


区 


E 不 完全 数据 矩阵 万 中 估计 缺失 值 。 
从 表 对 可 以 用 来 重 


多 


建 估计 网 


息 的 均 方 误差 最 小 化 来 


AREY 
比 ， 这 些 算法 在 干 
1 和 2 PAM 


al 
il 


标 


色 越 深 , 表 
， 对 FPGA 和 


以 自动 选择 最 优 


1 


| 的 影响 上 限 , 鉴于 此 , 可 以 得 出 这 样 的 结论 : 


备 界 值 不 可 月 


50 


50 


60 


60 


60 


缺失 数据 加 分 He6) °° 


DLS 方法 


weet bate) °° 


(b)FPCA 


缺失 数据 身分 t%) °° 


(c)VBPCA 


图 1 


劳 虑 不 同 数量 的 潜在 医 


H, VBPCA 也 不 


90 


90 


会 出 现 过 拟 合 的 


素 ( 秩 ) 的 缺失 数据 加 权 相 对 误差 。 测 试 网 络 
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1 
~ 38 
x 
K ; 
K 
图 
%5 
本 
a E tesa Santen) °° i 
(a)LS 方法 
0.25 
0.2 
3 
g 
ae OS 0.15 
K 
过 
i 
7 
0.1 
0.05 
a 60 缺失 数据 加 分 比 ob) °° 0 
(b)FPCA 
0.25 
0.2 
š 
ARR 0.15 
EK] 
W 
x 
0.1 


0 60% 拓 数据 自分 比 (%)80 90 


(c)BPCA 


络 为 京 津 公路 主干 首 


0.05 


图 2 考虑 不 同 数量 的 潜在 因素 ( 秩 ) 的 缺失 数据 加 权 相 对 误差 。 测 试 网 


分 析 了 各 种 道路 网 络 下 相关 方法 的 怕 
析 一 下 不 同 的 插 补 方法 在 一 周 内 的 表现 。 


FE 能 情况 ,首先 分 
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(a, 一 6 上 ,的 重建 误差 平 方 和 的 交通 模式 来 填补 缺失 


值 。 基 于 最 小 二 乘 的 方法 中 ， 多 路 径 表 示 “〈 张 量 法 ) 趋向 于 达 
到 最 佳 性 能 。 此 外 ， 主 干道 和 交流 道 、 多 路 表示 〈 张 量 方法 ) 
也 达到 了 比 其 他 方法 如 FPGA 和 VBPCA 更 好 的 插 补 精度 。 然 
而 在 高 速 公 路 方面 ， 考 虑 多 路 表示 的 优势 并 不 明显 。 看 来 ， 张 
量 表示 在 小 地 方 道 路 交通 行为 更 不 稳定 的 情况 下 更 有 用 。 在 这 
种 情况 下 ， 速 度数 据 的 多 路 表示 是 提取 底层 流量 模式 的 一 种 有 
效 方法 。 
3 所 示 为 LS、FPGA 和 VBPCA 这 三 种 算法 在 一 周 的 不 
同时 间 的 插 补 误差 。 结 果 显示 一 周 时 间 内 不 同道 路 类 别 的 速度 
数据 。 在 这 种 情况 下 ， 丢 失 的 数据 百分比 为 70%。 对 于 高 速 公 
路 ， 在 大 多 数 时 间 里 VBPCA 与 其 他 方法 相 比 具有 较 低 的 加 权 
相对 误差 。 正 如 预期 的 那样 ，VBPCA 对 于 高 速 公路 的 速度 数 
据 具 有 最 低 的 总 体 估算 误差 。 对 于 主干 道 ， 这 三 种 方法 在 大 部 
分 时 间 内 都 有 类 似 的 性 能 。 然 而 ， 在 某 些 时 间 里 ，FPGA 和 LS 
会 具有 较 大 的 估计 误差 ， 但 是 VBPCA 从 一 天 到 另 一 天 的 估计 
性 能 变化 不 显著 。 也 在 LS、FPCA 和 VBPCA 对 于 快速 路 的 性 
能 上 观察 到 类 似 的 趋势 。 对 于 主要 和 局 部 次 干道 ， 所 有 这 三 种 
方法 在 七 天 内 都 产生 了 较 大 的 插 补 错误 。 图 3 中 不 同日 
VBPCA 算法 效果 有 时 并 非 最 佳 ， 造 成 这 种 现象 的 原因 是 重建 
数据 出 现 了 噪声 或 元 余 ， 导 致 在 去 除 噪 声 或 元 余数 据 过 程 中 插 
补 性 能 受到 了 一 定 程度 的 扰动 影响 ， 这 种 现象 在 误差 容忍 范围 
内 ， 因 此 是 正常 的 。 可 以 得 出 这 样 的 结论 : VBPCA 的 插 补 性 
能 与 其 他 方法 如 LS、FPCA 相 比较 ， 在 交通 条 件 每 日 变化 的 条 
件 下 具有 更 强 的 鲁 棒 性 。 
表 1 显示 了 所 提出 的 各 种 方法 在 恢复 速度 数据 中 引起 的 仿 
A, 偏 置 的 单位 是 km/hr. BRA, 在 所 有 的 测试 用 例 中 ， 
当 偏 置 值 小 于 1 km/hr 时, 所 提出 的 算法 不 会 对 估计 数据 添加 
显著 的 偏差 。 然 而 ， 由 FPCA 和 LS 得 到 的 估计 速度 数据 与 其 
他 方法 得 到 的 数据 相 比 较 有 稍 高 的 偏 置 (=0.5 km/ hr ) 。 依 此 
类 推 ， 可 计算 出 不 同道 路 类 型 的 估计 速度 数据 的 方差 方差 的 
单位 是 km / hr? 。 括 号 中 的 值 代表 估算 速度 数据 相对 于 实际 速 
度数 据 的 百分比 变化 。 它 也 显示 了 实际 速度 数据 的 方差 ， 正 如 
预期 的 那样 ， 插 补 算法 低估 了 估算 数据 的 方差 。 例 如 ， 高 速 公 
路 的 速度 数据 的 实际 方差 约 为 149 km /hr*。 然 而 ， 不 同 的 插 


图 3 显示 了 这 


些 方法 对 不 同道 路 类 型 的 插 补 精度 。 在 高 速 公路 的 情景 下 ， 
VBPCA 达到 最 低 的 加 权 相 对 误差 并 紧 随 FPCA 之 后 。 与 其 他 


道路 类 别 相 比 ， 高 速 公路 的 插 补 误差 较 之 所 有 算法 都 要 低 。 对 
于 主要 和 次 要 干道 ，VBPCA 相 比 其 他 方法 提供 了 更 好 的 性 能 。 
MSH, VBPCA 也 达到 了 更 好 的 性 能 。 在 市 区 巷道 的 情况 下 ， 


相关 算法 都 存在 较 大 的 插 补 误差 ， 但 VBPCA 


的 误差 最 小 。 


上 述 结果 的 原因 可 分 析 如 下 : LS. FPGA 和 VBPCA 这 三 


种 算法 都 试图 通过 寻找 那些 可 以 减少 


观测 速度 数据 


补 方法 获得 的 速度 数据 的 方差 为 90-120 km? Shr? 。 此 外 ， 随 
着 丢失 数据 百分比 的 增加 ， 实 际 和 预期 的 速度 数据 间 的 差异 变 
得 更 大 了 。 对 于 高 速 公 路 ，VBPCA 提供 了 速度 数据 方差 的 最 
佳 估 计 。 对 于 其 他 类 型 的 道路 如 主干 道 、 快 速 路 、 次 干道 和 埠 
道 ， 由 VBPCA 得 到 的 估算 数据 方差 最 接近 实际 速度 数据 的 方 
Bo 

结果 表明 ，VBPCA 方法 的 性 能 与 LS、FPCA 相 比 在 秩 的 
选择 上 高 度 敏感 。VBPCA 由 于 它 的 性 能 对 于 日 变化 是 最 不 敏 
感 的 ， 所 以 对 于 交通 数据 集 的 插 补 是 特别 有 用 的 。 此 外 ， 它 为 
不 同道 路 类 别 的 其 他 算法 提供 更 好 的 性 能 。 
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Det r 0.25 T T 0.25 - - 
= 
一 让 请 — mt) 
ade VercA) zall E vePca)]| | gal EvePcA) 
= 008 Hots #015 | 
g z p 
g g g 
Z 0.04 去 0.1 Bot 
0.02 0.05 F 0.05 F 
0 0 0 
1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7 
日 期 (2011 年 8 月 ) 日 期 (2011 年 8 月 ) 日 期 (2011 年 8 月 ) 
() 京 津 高 速 公路 (b) 京 津 公 路 主干 道 (c) 天 津 市 区 次 干道 
图 3 不 同道 路 网 在 一 周 内 不 同日 子 的 算法 加 权 相 对 误差 。 重建 误差 是 在 70% 的 数据 丢失 的 情况 下 进行 的 


表 1 不 同道 路 类 型 的 估算 速度 偏差 


偏差 
道路 类 型 丢失 数据 
FPCA LS VBPCA 
10% 0.009 0.069 0.004 
ee 20% 0.013 0.065 -0.007 
京 津 高 速 公路 
_ 40% 0.009 0.068 -0.012 
CO #8538 =120 km/hr 
(O 60% 0.008 0.076 0.008 
= 90% 0.006 0.065 -0.002 
© 
© 10% 0.009 0.438 -0.003 
re w) 20% 0.009 0.409 0.006 
pd 公路 主干 道 
© 7 40% 0.005 0.468 0.016 
(00 平均 速度 =100 km/hr 
qm 60% -0.005 0.379 0.004 
90% -0.007 0.378 0.005 
10% -0.009 0.479 0.0019 
E 20% 0.003 0.349 -0.007 
市 区 快速 路 
= 40% 0.002 0.418 -0.006 
平均 速度 =80 km/ hr 
60% -0.005 0.419 0.008 
90% -0.027 0.432 -0.007 
10% 0.011 0.370 -0.013 
20% 0.011 0.385 -0.013 
市 区 次 干道 
40% 0.003 0.395 0.022 
平均 速度 =60 km/hr 
60% -0.003 0.418 0.013 
90% -0.002 0.419 0.015 
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似 估计 新 方法 ， 该 方法 在 缺失 数据 的 情况 下 获得 流量 模式 ， 得 


到 大 规模 路 网 的 低 秩 表示 


。 分 析 了 不 同类 型 的 道路 以 及 在 一 周 


或 半 个 月 内 不 同日 子 的 各 种 矩阵 和 张 量 完成 方法 的 重建 精度 ; 


还 分 析 了 潜在 因素 的 选择 


对 恢复 速度 数据 估计 精度 的 影响 、 估 


计 速 度数 据 中 的 方差 和 偏 


差 ,通过 不 同 的 


表明 提出 新 方法 的 估计 精度 、 数 据 集 的 偏差 达到 了 较 好 的 效果 。 
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